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科学 数据 开放 共享 合作 关系 实证 研究 - 


以 北京 大 学 开放 研究 数据 平台 为 例 


Eke Em EER 


' 上 海 大 学 图 书 情报 档案 系 EY 200444 “中 国 科学 院 文献 情报 中 心 北京 100190 


fi 要 : [目的 /意义 ] 揭示 北京 大 学 开放 研究 数据 平台 3 个 代表 性 数据 集 的 利用 现状 ,为 科学 数据 开放 共享 相关 研究 提供 
参考 。 [方法 “过程 ] 选 择 CNKI 中 利用 CFPS\CHARLS 和 CLHLS3 个 数据 集 的 论文 作为 研究 对 象 , 采 用 网 络 分 析 
方法 并 借助 相关 工具 ,分 别 从 作者 、 机 构 、 主 题 维度 对 合作 研究 进行 分 析 。[ 结果 /结论 ]2011 年 后 各 研究 主体 的 年 
度 合作 度 趋 于 稳定 , 随 研究 主体 范围 扩大 ,合作 率 逐 渐 降 低 。3 种 中 心 度 指 标 相 互补 充 可 发 现 重要 机 构 。 一 级 机 
构 呈 现 以 北京 大 学 为 核心 ,部 分 机 构 间 保持 合作 ,众多 机 构 积 极 参与 合作 的 情形 ;合作 机 构 数 目 和 总 合作 次 数 排 
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名 靠 前 的 二 级 机 构 较 稳定 ,相互 间 保 持 稳固 合作 关系 ,大 致 可 将 其 分 为 3 类 机 构 。 核 心 作者 群 表现 出 部 分 作者 团 
体 合作 频繁 且 合作 关系 稳固 ,并 存在 中 介 作 者 可 连通 几 个 合作 团体 。 合 作 研 究 论文 涉及 主题 丰富 ,重点 研究 主题 
包括 老年 人 身心 健康 、 家 庭 消费 及 资产 情况 以 及 老龄 化 人 口 的 社会 保障 。 为 促进 科学 数据 开放 共享 的 发 展 ,未 来 
可 从 建设 权威 性 科学 数据 开放 共享 集成 平台 融合 学 术 数 据 库 \ 组 织 学 术 竞 赛 等 方面 改进 。 

Sei. 开放 科学 数据 CFPS CHARLS CLHLS 合作 分 析 


la 

:一 近年 来 ,开放 科学 研究 已 引起 全 球 科学 界 的 广泛 
AR ,开放 科学 数据 为 其 中 的 重要 一 环 P。 我 国 早 
#62015 年 11 月 3 日 公布 的 “十 三 五 规划 ”中 首次 提出 
“ 实 焉 国家 大 数据 战略 ,推进 数据 资源 开放 共享 ""， 
而 得 国务 院 办 公 厅 颁布 的 《科学 数据 管理 办 法 》 确立 
了 科学 数据 “开放 为 常态 .不 开放 为 例外 ”的 共享 原 
则 中。 开放 科学 数据 在 我 国 越 来 越 得 到 高 度 重视 , 目 
前 学 界 围绕 科学 数据 开放 共享 中 的 数据 治理 5" 、 影 
HART 、 共 享 政策 * 、 机 制 模式 0" " .利益 相关 者 


数据 项 目 , 如: 中国 家庭 追踪 调查 ( China family panel 
studies ,CFPS) .中 国 健康 与 养老 追踪 调查 ( China health 
and retirement longitudinal study ,CHARLS) .中 国 老 年 健 

影响 因素 跟踪 调查 ( Chinese longitudinal healthy lon- 
gevity survey,CLHLS) , 现 已 更 名 为 中 国 老年 健康 与 家 
庭 幸 福 调查 (Chinese longitudinal healthy longevity sur- 
vey and happy family，CLHLS-HF) 等 。 这 3 个 跟踪 调查 
项 目 分 别 始 于 2010 年 .2011 年 和 1998 年 , 均 已 成 为 具 
有 规范 性 ,规模 性 和 周期 性 的 调查 数据 集 ,并 获 广泛 关 
注 与 利用 ” 。 此 外 ,基于 北京 大 学 开放 研究 数据 平台 
开展 的 “全 国 高 校 数 据 驱 动 创新 研究 大 赛 ”, 大力 促进 


角色 与 责任 ”"” 、 共 享 平台 ”等 主题 进行 了 广泛 探 
索 。 同 时 ,国内 外 已 建立 众多 科学 数据 开放 共享 平 
台 ” ,包括 我 国正 在 建设 中 的 20 个 国家 科学 数据 中 
心 " ,和 一 些 高 校 科学 数据 开放 平台 ”"”。 其 中 ， 
北京 大 学 开放 研究 数据 平台 就 是 一 个 建设 典范 。 截 至 
2021 年 4 月 28 日 ,该 平台 已 收录 73 个 数据 空间 和 314 
个 数据 集 , 拥 有 一 批 国内 具有 极 高 影响 力 的 精品 调查 


了 科学 数据 的 重复 使 用 及 学 术 产 出 。 科 学 数据 重用 可 
有 效 避 免 科学 数据 重复 采集 ,节省 经 费 旦 提高 效率 ,但 
同时 也 需 耗 费 一 定 精力 消化 已 有 信息 。 相 较 于 传 
统 科研 合作 关系 ,以 科学 数据 重用 为 纽带 的 合作 可 积 
极 推 动 科学 数据 开放 共享 的 发 展 。 因 此 ,本 文选 择 北 
京 大 学 开放 研究 数据 平台 探索 科学 数据 开放 共享 的 合 
作 关 系 。 截 至 2021 年 5 月 已 有 2 篇 论文 介绍 了 北京 


* 本 文系 国家 社会 科学 基金 项 目 “ 开放 科学 环境 下 的 科学 数据 开放 共享 机 制 与 对 策 研究 "(项目 编号 :18ATQ007) 研 究 成 果 之 一 。 
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以 北京 大 学 开放 研究 数据 平台 为 例 [ 则 图 用 少 报 字 作 ， 


大 学 开放 研究 数据 平台 建设 ”” ,但 尚未 发 现 此 平台 
数据 利用 情况 的 研究 。 因 此 ,本 文 基于 北京 大 学 开放 
人 研究 数据 平台 的 CFPS、CHARLS ,CLHLS3 个 科学 数据 
集 ,结合 中 国 知 网 (CNKI) 中 利用 这 些 数据 发 表 的 论 
文 , 采 用 网 络 分 析 方 法 和 相关 工具 , 拟 对 作者 和 机 构 合 
作 研 究 做 初步 分 析 , 以 揭示 北京 大 学 开放 研究 数据 的 
利用 现状 ,并 进一步 促进 科学 数据 开放 共享 的 发 展 。 


2 数据 及 研究 方法 


2.1 数据 获取 及 处 理 

在 CNKI 专业 检索 界面 进行 检索 ,检索 范围 为 学 
术 期 刊 ,分 别 输入 检索 式 “SU% = (* CFPS? + * China 
Family Panel Studies’ + ‘ 中 国家 庭 追 踪 调 查 ”)”“SU% 
= CHARLS’ + ‘China Health and Retirement Longitu- 
dial Study” + “中 国 健康 与 养老 追踪 调查 ')”“SU% 
= CLHLS’ + ‘ Chinese Longitudinal Healthy Longevity 
Stirvey ” + “中 国 老年 健康 影响 因素 跟踪 调查 ”+ “中 国 
老 古 健康 调查 ' + “中 国 老人 健康 长 寿 影响 因素 跟踪 
调 春 " )” ,并 将 检索 起 始 日 期 分 别 限定 为 2010 年 1 月 
2011 年 1 月 1 日 .1998 年 1 月 1 日 ,其 他 条 件 保 
AURE. WE KTR HP 2021 年 4 月 28 日 ,得 到 
期 到 论文 分 别 有 1 067 .1 519 和 193 篇 。 
“合并 以 上 3 类 数据 集 相关 期 刊 论文 检索 结果 , 且 
由 证 检索 结果 存在 干扰 因素 ,如 主题 词 “CFPS" 为 
“Céll-free protein synthesis ”的 缩写 ,或 者 “CHARLS #f 
出 磁 在 人 名 中 ,经 过 人 工 筛选 并 自 编程 序 去 重 后 最 终 
得 到 期 刊 论文 1 493 篇 ,论文 去 重 依据 为 若 文章 标题 、 
期 入 名 称 和 出 版 年 份 一 致 , 则 为 重复 论文 。 因 2021 年 
数据 不 完全 , 故 不 纳入 统计 分 析 范 畴 。 在 北京 大 学 开 
放 科学 数据 利用 研究 中 ,2011 年 前 仅 有 2 篇 英文 论文 ， 
但 在 2011 年 ( 含 ) 之 后 ,无 论 中 文 论文 还 是 英文 论文 均 
呈现 随 年 份 显著 增长 的 趋势 ,2018 年 后 增长 速率 大 幅 
提升 ,年 度 发 文 量 总 数 也 呈现 出 相似 趋势 ,此 平台 受到 
越 来 越 多 的 关注 与 利用 。 
2.2 研究 方法 及 工具 

本 文采 用 社会 网 络 分 析 法 ,将 合作 度 和 合作 率 
作为 分 析 北 京 大 学 开放 研究 数据 合作 研究 的 基本 指 
标 ,并 就 不 同 研究 主体 分 别 从 机 构 合 作 ” 和 作者 合作 
两 个 维度 探讨 合作 情况 ,借助 软件 Pajek 2. 05 计算 网 
络 中 心 度 ”"。 涉 及 作者 姓名 去 重 、 中 英文 对 照 、 合 并 
以 及 机 构 名 称 中 英文 对 照 和 合并 , 均 采 用 人 工 处 理 和 
自 编 代码 辅助 的 方式 。 网 络 可 视 化 则 通过 VOSviewer 
1.6.16 软件 实现 。 


pat 


3 ”合作 研究 分 析 


3.1 数据 预 处 理 

为 从 机 构 合 作 和 作者 合作 维度 分 析 北 京 大 学 开放 
科学 数据 利用 的 合作 研究 , 需 基 于 1 493 篇 期 刊 论文 
对 数据 做 进一步 处 理 。 
3.1.1 机 构 合 作 数 据 

本 文 机 构 合作 分 析 含 一 级 机 构 和 二 级 机 构 两 个 层 
面 ( 非 高 校 仅 涉 及 一 级 机 构 , 如 中 国 疾 病 预 防 控制 中 
心 ) ,其 中 高 校 一 级 机 构 为 学 校 ,如 北京 大 学 ;二 级 机 构 
为 高 校 设置 的 学 部 或 学 院 ,如 北京 大 学 医学 部 、 上 海 大 
学 经 济 学 院 ,机构 数据 均 获 取 自 各 高 校 官网 。 同 篇 论 
文 忽略 机 构 合 作 次 数 , 仅 考 虑 合作 关系 。 在 1 493 篇 
论文 中 ,一 级 机 构 合 作 研 究 共 549 篇 , 占 36.77% ,涉及 
530 个 一 级 机 构 ; 二 级 机 构 合 作 研 究 共 562 篇 , 占 
37.64% ,涉及 785 个 二 级 机 构 。 
3.1.2 作者 合作 数据 

在 1 493 篇 论文 中 ,作者 合作 研究 共 1 159 篇 , 占 
77.63% ,涉及 2 642 位 作者 。 为 更 清晰 地 揭示 作者 利 
此 平台 数据 合作 人 研究 的 情况 ,本 文 依据 普 莱 斯 定律 
选 核 心 作者 群 ”。 发 文 量 最 多 的 作者 为 北京 大 学 
国家 发 展 研 究 院 赵 泡 辉 教授 , 共 发 文 18 篇 。 核 心 作者 
群 即 选择 发 文 数目 N > =0.749 V18 ~3 篇 的 作者 , 即 
本 文 核心 作者 群 包含 199 位 作者 ,后 文 则 据 此 进行 作 
者 合作 研究 分 析 。 
3.1.3 年 度 合 作 度 和 年 度 合 作 率 

不 同 研究 主体 年 度 合作 度 和 年 度 合 作 率 变化 见 表 
1 ,人 研究 主体 依次 为 一 级 机 构 、 二 级 机 构 和 作者 。 由 表 
1 可 知 ,2011 年 后 各 人 研究 主体 的 年 度 合作 度 趋 于 稳定 ， 

表 1 不 同 研究 主体 年 度 合作 度 、 合 作 率 变化 统计 


R H 


一 级 机 构 二 级 机 构 作者 
ER “年 度 合作 “年 度 合作 “年 度 合作 “年 度 合作 “年 度 合作 “年 度 合作 
度 / 个 率 /% 度 /个 率 /% 度 /个 率 /% 
2009 3 100 4 100 4 100 
2011 0 0 0 0 3 33 
2012 2 43 2 57 3 71 
2013 2 53 2 65 3 71 
2014 3 48 3 54 3 76 
2015 3 37 3 43 3 72 
2016 3 37 3 44 3 81 
2017 2 37 2 46 3 74 
2018 2 33 3 39 3 79 
2019 2 36 3 42 3 80 
2020 3 35 3 43 3 78 
2021 2 42 3 45 3 78 
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作者 为 3 个 ,机 构 为 2 个 或 3 个 ,表明 每 年 利用 此 平台 
数据 的 合作 研究 中 ,平均 每 篇 文章 包含 3 位 作者 ,涉及 
2 个 或 3 个 一 级 或 二 级 机 构 。 此 外 ,2011 年 后 各 研究 
主体 的 年 度 合作 率 有 明显 区 别 与 联系 。 区 别 体现 在 纵 
向 比较 ,从 左 到 右 年 度 合 作 率 依次 约 30% -55% 40% 
-65% 、70% -80% 。 联 系 体现 在 横向 比较 , 随 研究 主 
体 范围 扩大 ,合作 率 逐 渐 降 低 。 
3.2 机构 合作 研究 分 析 

本 文 从 一 级 机 构 和 二 级 机 构 两 个 层面 分 析 中 心 度 
排名 前 10 的 机 构 利用 此 平台 数据 进行 合作 研究 的 


情况 。 
3.2.1 机 构 中 心 度 

合作 网 络 中 心 度 排名 前 10 的 机 构 及 指标 值 如 表 2 
所 示 。 点 度 中 心 度 反映 某 机 构 合 作 机 构 总 数 。530 个 
一 级 机 构 中 ,北京 大 学 与 106 个 机 构 产 生 合作 ,点 度 中 
心 度 最 大 ,遥遥 领先 ; 其 次 为 浙江 大 学 和 杜 克 大 学 。 
785 个 二 级 机 构 中 ,点 度 中 心 度 最 大 的 两 个 机 构 均 来 
自 北京 大 学 ,分 别 是 经 济 与 管理 学 部 和 医学 部 ,但 绝对 
数值 相差 较 大 ,分 别 与 103 个 和 39 个 二 级 机 构 产 生 合 
作 ; 其 次 为 浙江 大 学 医学 院 和 中 国 疾病 预防 控制 中 心 。 


R2 机 构 合作 中 心 度 排名 前 10 机 构 及 指标 值 一 览 


中 心 度 一 级 机 构 值 二 级 机 构 值 
点 度 中 心 度 北京 大 学 106 北京 大 学 经 济 与 管理 学 部 103 
浙江 大 学 42 北京 大 学 医学 前 39 
S 杜 克 大 学 36 浙江 大 学 医学 院 26 
N 中 国人 民 大 学 24 中 国 疾病 预防 控制 中 心 23 
= 1 东 大 学 24 杜 克 大 学 医学 院 19 
er 西南 财经 大 学 22 昆山 杜 克 大 学 全 球 健康 研究 中 心 17 
© 中 国 疾病 预防 控制 中 心 21 武汉 大 学 社会 科学 学 部 16 
© 南 加 州 大 学 20 中 国人 民 大 学 经 济 学 部 16 
<f 华中 科技 大 学 17 北京 大 学 社会 科学 学 部 15 
© 密 西 根 大 学 16 西安 交通 大 学 医学 部 15 
改过 中 心 度 北京 大 学 0.394 3 北京 大 学 经 济 与 管理 学 部 0.2447 
N 浙江 大 学 0.337 4 北京 大 学 医学 部 0.202 3 
© 中 国人 民 大 学 0.318 8 浙江 大 学 医学 院 0.194 1 
N 杜 克 大 学 0.306 3 四 川 大 学 华西 医院 0.193 2 
> 东 大 学 0.303 8 杜 克 大 学 医学 院 0.189 8 
< pg 鲁 大 学 0.303 8 西安 交通 大 学 医学 部 0.189 1 
ra 南 加 州 大 学 0.303 1 南 加 州 大 学 经 济 学 系 0. 188 8 
(= 武汉 大 学 0.302 1 北京 大 学 理学 前 0.188 5 
= 中 央 财 经 大 学 0.301 9 河北 医科 大 学 附属 第 一 医院 0.1876 
aS 中 南 财经 政法 大 学 0.298 8 密 西 根 大 学 医学 院 0.1876 
rpo 浙江 大 学 0.004 5 北京 大 学 经 济 与 管理 学 部 0. 004 4 
南 加 州 大 学 0.003 1 北京 大 学 医学 前 0.0017 
中 国 社会 科学 院 0.002 6 浙江 大 学 医学 院 0. 000 7 
南京 农业 大 学 0.002 2 q 川 大 学 华西 公共 卫生 学 院 0. 000 6 
中 国人 民 大 学 0.002 1 南京 审计 大 学 公共 管理 学 院 0.000 4 
杜 克 大 学 0.002 1 中 国 疾病 预防 控制 中 心 0.000 4 
中 国 疾病 预防 控制 中 心 0.001 2 四 川 大 学 华西 医院 0. 000 4 
复旦 大 学 0.001 0 山东 大 学 公共 卫生 学 院 0.000 4 
华中 科技 大 学 0.001 0 南京 大 学 社会 学 院 0. 000 3 
密 西 根 大 学 0.0009 西安 交通 大 学 医学 部 0.000 3 


接近 中 心 度 反 映 网 络 中 某 机 构 与 其 他 机 构 的 接近 
程度 。 其 排名 前 10 的 一 级 机 构 与 点 度 中 心 度 有 6 所 
机 构 相 同 ,北京 大 学 和 浙江 大 学 为 网 络 中 与 其 他 机 构 
最 接近 的 两 所 高 校 。 二 级 机 构 中 ,接近 中 心 度 排 名 前 
5 的 机 构 与 点 度 中 心 度 排 名 唯一 不 同 之 处 在 于 四 川 大 
学 华西 医院 代替 中 国 疾病 预防 控制 中 心 , 并 新 增 5 所 
机 构 。 


中 介 中 心 度 反 映 某 机 构 在 网 络 中 充当 “桥梁 ”的 
程度 。 表 2 反映 出 一 级 机 构 排序 前 10 中 ,此 指标 与 前 
两 个 指标 差异 较 大 , 且 新 增 了 中 国 社会 科学 院 .南京 农 
业 大 学 和 复旦 大 学 3 所 机 构 。 二 级 机 构 中 北京 大 学 经 
济 与 管理 学 部 和 医学 部 、 浙 江 大 学 医学 院 稳 居 前 3 , 较 
前 两 个 指标 新 增 4 个 机 构 。 

以 上 3 个 中 心 度 均 可 反映 网 络 中 的 重要 机 构 , 并 
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可 相互 补充 。 综 合 以 上 结果 ,网 络 中 排序 前 10 的 重要 
机 构 包 括 17 个 一 级 机 构 和 25 个 二 级 机 构 , 这 些 重 要 
机 构 在 下 文 分 析 中 会 进一步 得 以 体现 。 
3.2.2 一 级 机 构 合作 研究 

1 为 一 级 机 构 合 作 最 大 连通 图 ,节点 大 小 反映 
合作 机 构 总 数 。 一 级 机 构 共 合作 549 篇 论文 , 含 530 
个 一 级 机 构 , 图 1 中 含 447 个 ,表明 84. 34% 的 一 级 机 
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构 间 可 相互 连通 。 显 而 易 见 ， 北 京 大 学 "节点 最 大 ， 
表明 其 合作 机 构 总 数 最 多 ,与 其 他 106 个 机 构 共 合 
224 次 ,其 中 11 个 合作 次 数 > =5 次 。106 个 一 级 机 构 
涉及 31 所 国外 高 校 \47 所 国内 高 校 及 28 个 非 高 校 机 
构 。 由 此 可 见 ,北京 大 学 的 一 级 合作 机 构 范 围 广泛 , 涉 
及 国内 、 国 外 及 非 高 校 机 构 , 且 与 部 分 高 校 之 间 保持 着 
较 强 合作 关系 。 
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1 一 级 机 构 合作 最 大 连通 图 ( 共 447 个 节点 ) 


合作 机 构 总 数 排名 第 二 为 浙江 大 学 ,与 各 个 一 
机 构 合 作 了 61 次 , 除 与 北京 大 学 合作 5 次 外 ,与 其 他 6 


研究 共 562 篇 , 含 785 个 机 构 ,产生 1 239 次 合作 ,最 大 
连通 图 保留 了 475 个 节点 ,表明 60. 51% 的 机 构 间 可 相 


个 一 级 机 构 的 合作 次 数 > =2 次 ;国外 高 校 杜 克 大 学 与 
36 个 一 级 机 构 合作 了 69 次 , 除 与 北京 大 学 合作 8 次 外 ， 
与 其 他 10 个 机 构 的 合作 次 数 > =2 次 。530 个 一 级 机 构 
共产 生 1 067 对 机 构 合作 ,其 中 909 对 机 构 仅 有 1 次 合 
作 , 占 85.19% ,表明 大 多 数 一 级 机 构 合作 强度 较 低 。 整 
体 来 看 ,一 级 机 构 合 作 网 络 呈现 以 “北京 大 学 ”为 核心 ， 
部 分 机 构 间 保持 合作 ,众多 机 构 积 极 参与 合作 的 情形 。 
3.2.3 ”二 级 机 构 合作 研究 

图 2 为 二 级 机 构 合 作 最 大 连通 图 。 二 级 机 构 合作 


互 连 通 。 图 中 最 大 节点 为 北京 大 学 经 济 与 管理 学 部 ， 
其 合作 机 构 数目 最 多 ,与 其 他 103 个 机 构 合 作 了 170 
次 ,其 中 与 之 合作 次 数 排名 前 3 的 机 构 依 次 为 杜 克 大 
学 医学 院 (7 次 ) ,北京 大 学 医学 部 (6 次 ) 以 及 中 国 疾 
病 预防 控制 中 心 (6 次 ) ;北京 大 学 医学 部 的 合作 机 构 
总 数 排名 第 二 , 共 与 39 个 机 构 合 作 了 59 次 ;浙江 大 学 
医学 院 与 26 个 机 构 产 生 了 30 次 合作 ,节点 大 小 排名 
第 三 ,总 合作 次 数 排名 第 五 ;中 国 疾病 预防 控制 中 心 与 
23 个 机 构 产 生 了 41 次 合作 ,节点 大 小 排名 第 四 ,总 合 
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作 次 数 排名 第 三 ; 杜 克 大 学 医学 院 与 19 个 机 构 产 生 了 
33 钦 合作 ,节点 大 小 排名 第 五 ,总 合作 次 数 排名 第 四 。 
@G 一 级 机 构 合作 网 络 中 合作 机 构 数目 和 总 合作 次 数 
靠 前 的 机 构 较 稳定 , 且 相 互 间 保持 稳固 合作 关系 。 
来 看 ,1 239 对 二 级 机 构 合 作 中 1 100 对 机 构 仅 产 
Æ 1 次 合作 , 占 88.78% ; 仅 有 9 对 机 构 合作 次 数 > =5 
次 ,表明 大 部 分 二 级 机 构 的 合作 关系 没有 保持 , 仅 少 数 
机 构 维 持 着 较为 稳固 的 合作 关系 。 此 外 ,参与 合作 的 
二 级 机 构 大 致 可 分 为 3 类 ,一 类 为 noe: 
共 卫 生 学 院 ) ,二 类 为 经 济 管理 类 部 / 院 ,三 类 为 社会 
类 部 / 院 。 此 机 构 分 布 与 本 文 研究 数据 集 有 关 , CFPS 
数据 集 多 用 于 经 济 类 或 社会 学 类 主题 研究 , CHARLS 
和 CLHLS 数据 集 多 用 于 医学 类 相关 主题 研究 。 
3.3 ”作者 合作 研究 分 析 
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国 疾病 预防 控制 中 心 施 小 明 (Xiaoming Shi) , 共 发 表 11 
篇 论文 ,与 40 位 作者 产生 90 次 合作 ;北京 大 学 健康 老 
龄 与 发 展 研究 中 心 兽 毅 (Yi Zeng) ,与 45 位 作者 合作 
发 表 10 篇 论文 ,产生 88 次 合作 ;中 国 疾病 预防 控制 中 
OEA Z (Zhao-Xue Yin) ) FI S ERYR ( Yuebin Lv) 均 发 表 
7 篇 论文 ,分 别 与 23 位 和 31 位 作者 均 产 生 65 次 合作 ; 
此 外 , 施 小 明和 曾 谢 互 为 最 多 合作 次 数 作 者 , 谍 召 雪 、 
昌 跃 斌 的 最 多 合作 次 数 作者 分 别 为 施 小 明和 曾 谢 \ 施 
小 明 ,网络 中 其 余 作者 的 合作 总 次 数 均 > 20 次 。 由 此 
可 见 , 此 网 络 中 作者 合作 表现 较为 活跃 , 且 最 活跃 的 作 
者 间 保 持 着 稳固 合作 关系 。 

@ 号 和 GO 号 网 络 的 合作 人 数 > = 10 fi, OSM 
络 含 14 位 作者 ,其 中 来 自 北京 大 学 国家 发 展 研究 院 的 
MESES 39 位 作者 产生 86 次 合作 ;与 之 合作 的 美 


由 199 位 作者 形成 的 “核心 作者 群 ”合作 网 络 如 图 
3 所 示 ,节点 大 小 反映 某 作 者 的 合作 总 次 数 。 图 3 FF 
在 9 个 较 明 显 的 合作 网 络 ( 见 中- @) ,其 中 由 号 .加 号 
和 (号 网 络 增加 小 图 展示 用 于 后 文 分 析 。 中 号 网 络 含 
15 位 作者 ,人 数 最 多 。 依 据 原 始 数据 可 知 ,此 网 络 中 
有 4 位 作者 的 合作 总 次 数位 列 总 网 络 前 五 ,分 别 为 中 


国 南 加 州 大 学 经 济 学 教授 J Strauss 与 28 位 作者 合作 
了 62 次 , 且 互 为 最 多 合作 次 数 作者 。 人 号 网 络 含 11 
位 作者 ,其 中 来 自首 都 医科 大 学 卫生 管理 与 教育 学 院 
RIRE 34 位 作者 合作 了 44 次 ,来 自 北京 大 学 中 
国 社会 科学 调查 中 心 丁 华 与 30 位 作者 合作 了 38 次 ， 
两 位 为 此 网 络 总 合作 次 数 最 多 的 作者 , 且 相 互 合作 次 
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网 络 为 连通 网 络 ( 见 图 中 胶 圳 形 框 ) 。 计 算 作 者 中 介 
SEETI A, PIE . 施 小 明 . 景 汇 泉 .本 华为 排名 前 列 的 
PIER. GAL, 核心 作者 合作 网 络 表现 出 部 分 作者 
团体 合作 频繁 且 合 作 关系 稳固 ,并 存在 中 介 作者 可 连 
曾 几 个 合作 团体 的 情况 。 
3.4 ”重点 研究 主题 的 作者 合作 分 析 

对 作者 合作 研究 的 1 159 篇 论文 关键 词 进行 中 英 
文 对 照 .同义词 合并 .无 意义 词 (如 CFPS) 去 除 处 理 后 
得 到 2 062 个 关键 词 ,为 清晰 揭示 重点 研究 主题 ,选择 
出 现 频次 > =9 次 的 关键 词 网 络 ( 见 图 4) 。VOSviewer 
将 71 个 关键 词 自动 聚 为 7 类 ,结合 具体 研究 内 容 可 提 
炼 为 以 下 3 类 重点 研究 主题 : 
3.4.1 老年 人 身心 健康 

涉及 关键 词 如 慢性 病 .糖尿病 、 高 血压 ,抑郁 症状 、 
精神 健康 、 认 知 障碍 、 生 活 满意 度 、 幸 福 感 等 。 此 主题 
下 有 3 个 作者 团体 合作 发 文 较 多 ,团体 1 以 Changwei 
Li 为 代表 , 共 围绕 此 主题 发 表 8 篇 论文 ,涉及 21 位 合 
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图 3 “核心 作者 群 "合作 网 络 


作 作者 ,其 中 与 Tingting Liu 和 Zhiyong Zou 分 别 合作 6 
次 和 5 次 ,与 Jun Ma 等 7 位 作者 合作 2 次 ,与 其 余 12 
位 作者 仅 合作 1 次 ,研究 聚焦 于 中 老年 人 的 身体 健康 
问题 ,如 高 血压 .关节 炎 糖尿病 等 ;团体 2 以 兽 亲 为 代 
表 , 共 参与 发 表 7 篇 论文 ,与 38 位 作者 产生 合作 ,其 中 
与 施 小 明和 有 恋 召 雪 分 别 合 作 6 次 和 5 次 ,与 吕 跃 斌 等 
11 位 作者 合作 2 次 及 以 上 ,与 其 余 25 位 作者 仅 有 1 次 
合作 ,研究 侧重 老年 人 的 认 知 功能 ;团体 3 以 顾 大 男 为 
代表 ,在 其 发 表 的 6 篇 论文 中 与 10 位 作者 产生 合作 ， 
其 中 与 7 位 作者 的 合作 次 数 在 2 次 及 以 上 ,研究 关注 
影响 老年 人 健康 的 医疗 保健 问题 。 
3.4.2 家庭 消费 及 资产 情况 

主要 关键 词 如 收入 分 配 、 消 费 结构 、 商 业 保险 、 土 
地 流转 ,其 中 还 涉及 多 维 贫困 问题 ,相关 关键 词 如 精准 
扶贫 , 减 贫 效果 .灾难 性 卫生 支出 ` 收 入 差异 ,城乡 差异 
等 。 此 主题 中 未 发 现 明 显 的 作者 合作 团体 , 少 部 分 作 
者 合作 发 表 了 大 于 1 篇 的 论文 ,如 王 晓 全 围绕 “家 庭 商 
业 保 险 ” 发 表 了 3 篇 论文 ,涉及 4 位 合作 作者 , 除 与 贾 
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4 出 现 频次 > =9 的 关键 词 聚 类 ( 共 71 个 节点 ) 


es 2 次 合作 外 ,其 余 作者 仅 产 生 1 次 合作 ; 张 奇 林 
JOD 4 位 作者 合作 发 表 了 3 篇 关于 “ 家庭 贫困 ”的 论 

与 刘 世 爱 产生 了 大 于 1 次 的 合作 ; 钱 龙 发 表 了 3 
篇 簿 关 " 农 户 土地 流转 ”的 论文 ,涉及 4 位 合作 作者 ,但 


中 基于 北京 大 学 开放 研究 数据 平台 3 个 数据 集 的 现 有 
研究 在 2011 年 后 年 度 合作 度 趋 于 稳定 ,平均 每 篇 文章 
含 3 位 作者 ,涉及 2 个 或 3 个 一 级 或 二 级 机 构 。 随 研 
究 主 体 范围 扩大 ,合作 率 逐 渐 降低 。3 种 中 心 度 指标 
均 反 映 出 网 络 中 的 重要 机 构 , 并 可 相互 补充 。 中 心 度 
排名 前 10 的 重要 机 构 包 括 17 个 一 级 机 构 和 25 个 二 


6 涉及 关键 词 如 新 农 保 .医疗 保险 .养老 保险 、 社 会 
Pen ees eee ea ee es 
为 驳回 的 合作 关系 ,合作 发 表 3 篇 论文 。 其 余 大 部 分 
作 署 仅 产 生 1 次 合作 关系 ,如 关于 “新 农 保 "研究 的 18 
篇 论文 中 , 除 王 小 增 和 王 林 萍 产生 2 次 合作 外 ,其 余 39 
位 作者 之 间 仅 产生 一 次 合作 。 统 计 各 主题 作者 发 文 情 
况 可 知 ,多 数 作 者 仅 发 表 过 1 篇 论文 ,发 文 >1 篇 平均 
占 比 仅 为 11.52% 。 


级 机 构 。@) 一 级 机 构 合 作 网 络 呈 现 以 "北京 大 学 ”为 
核心 ,部 分 机 构 间 保持 合作 ,众多 机 构 积极 参与 合作 的 
情形 。 二 级 机 构 合作 网 络 中 合作 机 构 数 目 和 总 合作 次 


数 排名 靠 前 的 机 构 较 稳定 , 且 


相互 保持 稳固 合作 关系 。 


参与 合作 的 二 级 机 构 大 致 可 分 为 3 类 ,一 类 为 医学 类 
部 / 院 ,二 类 为 经 济 管理 类 部 / 院 , 三 类 为 社会 学 类 部 / 


院 。 核 心 作 者 合作 网 络 表现 


部 分 作者 团体 合作 频繁 


综 上 所 述 ,作者 合作 研究 涉及 主题 丰富 ,研究 群体 


重点 关注 “家 庭 ”" 和 “老年 人 ”, 家 庭 方 卫 


i 重点 探讨 金融 


且 合 作 关系 稳固 ,并 存在 中 介 作者 可 连通 几 个 合作 团 
体 的 情形 。@@ 作 者 合作 研究 涉及 主题 丰富 ,重点 研究 


资产 及 消费 ,老年 人 群体 着 习 


EE 研究 身心 健康 及 生活 保 


主题 包括 老年 人 身心 健康 ,家庭 消费 


资产 情况 ,以 及 


老龄 化 人 口 的 社会 保障 。 研 究 群 体重 点 关注 “家 庭 ” 


障 。 此 外 ,重点 研究 主题 下 绝 大 多 数 作 者 仅 有 1 次 发 
文 ,作者 合作 分 析 反 映 出 仅 少数 发 文 较 活 路 的 作者 可 
与 部 分 合作 者 保持 合作 ,但 只 产生 1 次 合作 的 现象 更 


和 “老年 人 ”。 此 外 ,重点 研究 主题 下 绝 大 多 数 作者 仅 
参与 1 次 发 文 ,作者 合作 分 析 反 映 出 仅 有 少数 发 文 较 


4 结论 与 讨论 


活跃 的 作者 可 与 部 分 合作 者 保持 合作 。 
基于 北京 大 学 开放 研究 数据 平台 3 个 数据 集 对 科 
学 数据 开放 共享 合作 关系 的 实证 研究 说 明 3 个 问题 : 


通过 上 述 实 证 研究 , 本文 有 如 下 3 个 主要 结论 : 


中 无 论 是 机 构 还 是 作者 层面 ,对 现 有 开放 研究 数据 
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的 合作 利用 范围 较为 局 限 , 参 与 机 构 以 北京 大 学 及 
其 学 部 为 主 , 参 与 活路 作者 中 曾 新 HEX RE TE SOE H 
北京 大 学 。 忆 各 研究 主体 的 合作 关系 绝 大 多 数 未 继 
续 维持 ,超过 85% 的 机 构 间 和 作者 间 仪 有 一 次 合 
名 合作 研究 主题 依赖 于 开放 科学 数据 的 类 型 和 内 
容 , 即 以 科学 数据 重用 为 纽带 的 合作 关系 依赖 于 科 
学 数据 本 身 , 一 定 程度 上 限制 了 此 种 形式 的 合作 维 
为 促进 科学 数据 开放 共享 的 发 展 ,本 文 就 以 上 问 


题 提 出 如 下 3 点 建议 :中 统一 开放 科学 数据 获取 来 源 ， 


建设 权威 性 科学 数据 开放 共享 集成 平台 。 目 前 国内 已 
有 平台 各 有 侧重 ,如 国家 科学 数据 中 心 以 科技 数据 为 
主 ,本 文 使 用 平台 则 以 社 科 类 数据 为 主 ,而 权威 性 集成 
平 合 的 建设 有 助 于 保证 科学 数据 的 全 面 性 和 统一 性 ， 
进 s 步 扩大 用 户 范围 ,可 缓解 本 研究 反映 的 参与 机 构 、 
作 王 范围 和 合作 研究 主题 局 限 等 问题 。 同 时 ,基于 此 
< 合 产生 的 科研 成 果 可 作为 更 全 面 的 实证 分 析 素 材 。 
秋 学 数据 开放 共享 集成 平台 建设 可 融合 学 术 数 据 
雇 将 相关 科研 成 果 及 研究 主题 发文 活跃 作者 等 信息 
和 ER 科学 数据 开放 共享 集成 平台 建设 中 ,为 用 户 提供 
呈 捷 式 服务 。@@ 基 于 集成 平台 组 织 大 范围 的 科学 数据 
普 训 等 学 术 性 活动 ,积极 推动 科学 数据 的 重复 使 用 及 
高 豆 利 用 。 

3 本 文 仅 利用 北京 大 学 开放 研究 数据 平台 3 个 数据 
集 入 现 有 研究 来 分 析 科学 数据 开放 共享 的 合作 研究 有 
一 定 的 局 限 性 ,今后 可 利用 北京 大 学 开放 研究 数据 平 
台 的 所 有 数据 集 以 及 其 他 开放 科学 数据 集 在 更 大 规模 
上 开展 进一步 研究 。 

参考 文献 : 


[ 1 ] UNESCO. UNESCO mobilizes 122 countries to promote open sci- 


ZN 


enceand reinforced cooperation in the face of COVID-19[ EB/OL]. 
[2021 -11 -19]. https://en. unesco. org/news/unesco -mobilizes 
-122 -countries -promote -open -science -and -reinforced -cooperation - 
face-covid-19. 

[2 ] 黄 如 花 , 赵 洋 , 黄 雨 婷 . Fel Bx PORE AE OF FE HE SJ. 图 书 情 报 
工作 ,2021 ,65(1) :140 - 149. 

[ 3 ] 人 民 网 . 中 共 中 央 关 于 制定 十 三 五 年 规划 的 建议 (全 文 )[EB/ 
OL]. [2021 - 11 - 19]. http;//politics. people. com. en/n/ 


2015/1103/c1001 27772701. html. 

[ 4 ] 国务 院 办 公 厅 . 国务 院 办 公 厅 关于 印发 科学 数据 管理 办 法 的 通 
[EB/OL]. [2021 -11 -19]. http://www. gov. en/zhengce/ 
content/2018 -04/02/content_5279272. htm. 

[5 ] 盛 小 平 , 郭 道 胜 . 科学 数据 开放 共享 中 的 数据 安全 治理 研究 


[12 


] NE, 


IFIS. 


] 


[J]. ABR 


El 


AR 


HE ,2020 ,64(22) : 25 - 36. 

] 盛 小 平 , 田 婧 ,向 桂林 . 科学 数据 开放 共享 中 的 数据 质量 治理 研 
究 [中 .图 书 情报 工作 ,2020, 64(22) : 
. 国内 外 科学 数据 开放 共享 影响 因素 研究 综述 


11 -24. 


[中 .情报 理论 与 实践 ,2021 ,44(8) : 173 - 179. 


2017(9) :91 - 100. 


] 盛 小 平 , 武 彤 . 国内 外 科学 数 
报 工 作 ,2019 ,63(17) : 6 - 14. 
] 李 成 赞 , 张 丽 丽 , 侯 艳 飞 , 等 .科学 大 数据 开放 共享 :模式 与 机 制 


国外 科学 数据 开放 共享 政策 有 


究 [ 中 .图 书馆 学 研究 ， 


所 开放 共享 研究 综述 [J. 图 书 情 


[下 .情报 理论 与 实践 ,2017, 40(11) : 45 -51. 


| KITCHIN R, COLLINS S, FROST D. Funding models for open ac- 


cess digital data repositories[ J]. Online information review, 2015, 


39(5) : 664 - 681. 


WESSELS B, FINN R L, LINDE P, et al. Issues in the develop- 


ment of open access to research data [ J] 。 


(1): 49 -66. 


HATLI]. 


11 - 13. 


[2021 -11 -19]. https 


OL]. [2021 -11 - 19]. 


xmjs/xmgk. htm. 


Prometheus, 2014, 32 


] 盛 小 平 , 吴 红 . 科学 数据 开放 共享 活动 中 不 同 利益 相关 者 动力 
图 书 情报 工作 ,2019, 63(17) : 40 -50. 
] 张 先 恩 . 国家 科学 数据 共享 工程 [可 . 科学 中 国 


人 ,2004 (9): 


] 国家 科技 基础 条 件 平 台中 心 . 国家 科学 数据 中 心 [EBZOL J. 


://www. escience. org. cn/data-center/. 


] 中 国人 民 大 学 中 国 调查 与 数据 中 心 . 中 国 综合 社会 调查 [ EB/ 


http://cgss. ruc. edu. cn/index. htm. 


] 中 国人 民 大 学 中 国 调查 与 数据 中 心 . 中 国 老年 社会 追踪 调查 项 
概况 [EB/OL]. [2021 -11 -19 ]. http://class. ruc. edu. cn/ 


[18] 北京 大 学 开放 研究 数据 平台 . 北京 大 学 开放 研究 数据 平台 简介 
[EB/OL]. [2021 -11 -19]. https://opendata. pku. edu. cn/a- 


[23 


[25] 黄 丽 霞 , 纪 苏 桐 . 基于 SNA 


[20] 


[21] 


[22] 


[24 ] 


bout. xhtml ; jsessionid = 45 d5426f10c05399 8 £4163 bcf98 b. 


[D] 


] 李 佳 潞 . 科研 人 员 数 据 重用 行为 影响 因素 及 促进 策略 研究 
. 长春 :东北 师范 大 学 ,2019. 


于 Dataverse 的 北京 大 学 开放 研究 


数据 平台 


ERLI]. 


下 书 情报 


VE, 2016 ,60(3 ) : 52 -58. 


AES EE , PETE, E. 北京 大 学 开放 研究 数据 平台 建设 : 


RSI). 图 书 情报 工作 , 2016 ,60(4) : 44-51. 


XAT ,余波 . Altmetrics Top100 论文 的 合作 模式 及 其 影 
RELY ,2020, 38(4): 3-8. 
] BUD. 科学 计量 学 领域 科研 机 构 合 作 网 络 演化 分 析 [ 中 


RA I). 情 


杂志 ,2012,31(12) : 40 
张 雪 ,张志强 , 陈 秀娟 . 3 
研 产 出 的 影响 一 一 以 国 


.情报 
一 45. 
于 期 刊 论文 的 作者 合作 特征 及 其 对 科 


际 医学 信息 学 领域 高 产 作者 为 例 [J]. 


情报 学 报 ,2019 ,38(1): 


29'=37. 


国内 阅读 推广 领域 作者 合作 关系 研 


究 [J]. 图 书 情报 工作 ,64(7): 119-126. 


29 


AERE P 


第 65 卷 第 23 期 2021 €12 月 


作者 贡献 说 明 : 程 雨 琦 :协助 数据 处 理 ; 
张 慧 :负责 论文 选 题 .撰写 与 修改 ; 王 传 清 : 负 责 论文 选 题 与 修改 。 


ss 


An Empirical Study on Collaborative Relation of Scientific Data Open Sharing: 
Based on Peking University Open Research Data Platform 
Zhang Hui’ Cheng Yuqi Wang Chuanqing” 
' School of Library, Information and Archives, Shanghai University, Shanghai 200444 
* Natioanl Science Library, Chinese Academy of Science, Beijing 100190 
Abstract: | Purpose/significance | This paper aims to reveal the utilization status of the three representative 
datasets in Peking University Open Research Data Platform and provide references for the related research of scientific 
data open sharing. | Method/process | This paper selected CNKI papers using CFPS, CHARLS and CLHLS as the 
research objects, and adopted network analysis method and relevant tools to analyze their collaborative research from 
the dimensions of authors, institutions and themes. | Result/conclusion | After 2011, the annual collaboration de- 
lee of the research subjects has tended to be stable, and the collaboration rate gradually decreased with the expan- 
ssion of the research subjects. The three centrality indicators can complement each other to find important institutions. 
Be first-level institutions show that Peking University is the core, some institutions maintain collaboration , and many 
apfititutions actively participate in collaboration. The top-ranked second-level institutions in terms of the number of 
(Ollaborative institutions and the total number of collaboration times are relatively stable, and maintain a solid collab- 
Etive relationship mutually, which can be roughly classified into three categories. The core author groups show that 
Sime author groups collaborate frequently and stably, and there are intermediary authors connecting to several collab- 
hive groups. Moreover, collaborative research papers cover a variety of topics, focusing on physical and mental 
Holth of elderly people, family consumption and assets, as well as social security issues for the aging population. It 
Mn be improved in terms of building an authoritative integration platform of scientific data open sharing, integrating 
eeademic databases ，and organizing academic competitions to promote the development of scientific data open sharing 
‘ithe future. 
©) Keywords: open scientific data CFPS CHARLS CLHLS collaboration analysis 
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